یک روش ترکیبی جدید یادگیری تقویتی فازی
Authors
Abstract:
در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه میشود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته میشود. هدف، یافتن مناسبترین عمل نامزد (تالی) برای هر قاعده میباشد. با استفاده از بردار شدت آتش قواعد فازی و عملهای نامزد مربوط به قواعد، توابع پایه حالت –عمل به گونهای تعریف شدهاند که شرایط قضایای روش تکرار سیاست کمترین مربعات را برآورده مینمایند. با استفاده از توابع پایه حالت- عمل تعریف شده و بهرهگیری از الگوریتم تکرار سیاست کمترین مربعات، یک روش جدید برای تازهسازی پارامترهای وزن تالی قواعد ارائه میشود. تحلیل ریاضی که برای این الگوریتم آورده میشود، کران خطایی برای اختلاف تابع مقدار ارزش حالت-عمل واقعی و تخمین تابع ارزش حالت-عمل حاصل از الگوریتم ارائه شده، تعریف میکند. نتایج شبیهسازی در مساله معروف قایق، حاکی از سرعت آموزش بالاتر و نیز کیفیت عملکرد بهترِ روش پیشنهادی نسبت به دو روش یادگیری کیوی فازی و یادگیری سارسای فازی است. از مزایای دیگر روش ارائه شده، عدم نیاز به تعیین نرخ آموزش است.
similar resources
تولید قواعد فازی احتمالی بهکمک یادگیری تقویتی
مهمترین بخش در یک سیستم فازی پایگاه قواعد آن است. یکی از مشکلات موجود در تولید قواعد فازی با دادههای آموزشی، وجود دادههای ناسازگار است زیرا در اینگونه دادهها چند خروجی برای وضعیتهای یکسان وجود دارد. لذا تولید قواعد و تصمیمگیری برای انتخاب تالی مناسب برای هر قاعده با چالش همراه خواهد بود. روشهای موجود از برآیند حالتهای ناسازگار استفاده میکنند که باعث تولید خروجی با مقدار میانگین تالیه...
full textیک روش چند عاملی جدید مبتنی بر یادگیری تقویتی برای شکلدهی ترافیک و تخصیص حافظه بافر در روترها
Normal 0 false false false EN-US X-NONE AR-SA MicrosoftInternetExplorer4 ...
full textیک روش جدید برای انتخاب ویژگی مبتنی بر منطق فازی
چکیده: انتخاب ویژگی یکی از چالش برانگیز ترین و از مهمترین فعالیتها در توسعه یادگیری ماشین و تشخیص الگوست. معیارهای ارزیابی ویژگی نقش بسیار مهمی برای ساخت یک الگوریتم انتخاب ویژگی دارند. در این مقاله یک معیار انتخاب ویژگی اصلاح شده با استفاده از منطق فازی برای انتخاب تعداد ویژگیهای مورد نیاز ارائه می شود. این معیار به شکل غیر فازی در تحقیقات قبلی استفاده میشود، اما در این مقاله با تعریف تعداد...
full textیک روش چند عاملی جدید مبتنی بر یادگیری تقویتی برای شکل دهی ترافیک و تخصیص حافظه بافر در روترها
چکیده دراین مقاله با توجه به ساختار توزیع شده شبکه های کامپیوتری و رفتار تصادفی موجود در آنها و از طرف دیگر محدودیت های زمانی که در الگوریتم های کنترلی برای اینگونه سیستمها وجود دارد، از مفاهیم سیستم های چند عاملی و تکنیک های یادگیری تقویتی برای شکل دهی ترافیک در روترها و تخصیص دینامیک حافظه بافر بین پورت های مختلف یک روتر استفاده شده است. در واقع با استفاده از این مفاهیم شکل دهنده ترافیک جدیدی...
full textروش یادگیری q-فازی در ترکیب با روش های بهینه سازی برای کنترل فازی تقویتی
طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...
15 صفحه اولارائه یک روش جدید یادگیری تقویتی پیوسته با تاکید بر تحلیل ریاضی
یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...
15 صفحه اولMy Resources
Journal title
volume 8 issue 1
pages 11- 20
publication date 2014-06
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023